Projekt 2 - EDA

Online shoppers intention zawierają informację o aktywności użytkowników w sesji i czy w trakcie sesji użytkownik dokonał jakiegoś zakupu

Podstawowe informacje

W celu pozyskania podstawowych informacji użyjemy narzędzia do zautomatyzowanej eksploracji danych pandas_profiling.

Nie ma braków danych Zmienna Month i VisitorsType (Returning, New, Other) typu object Zmienna Weekend i Revenue typu bool.

Zmienne Administrative, Informational, ProductRelated przedstawiają ile stron danego typu odwiedził użytkownik

Administrative_Duration, Informational_Duration, ProductRelated_Duration ile czasu w sumie użytkownik spędził na stronie danego typu

BounceRates - procent stron które użytkownik odwiedził bez żadnej dalszej interakcji

SpecialDay - jak blisko specjalnego dnia była sesja

Wnioski:

Macierz korelacji

Wnioski/pytania do macierzy korelacji

Dla ExitRates/BounceRates jedna obserwacja znajduje się w innej częsci trójkąta

Proporcje w spędzonym czasie w zależności od zakupu

Długość pobytu na stronie a zakup

Rodzaje ruchu

Rodzaj ruchu a zakup

Miesiące

PCA

Wnioski:

Z powodu dużej ilości zer w naszych danych, PCA nie daje szczególnie dobrych rezultatów. Widoczne na wykresie grupki wynikają z wartości zmiennej "SpecialDay", która przyjmuje w końcu ograniczoną ilość wartości - zależną od dnia, nie użytkownika.

Weekend

Revenue vs PageValues/ ExitRates/ BoinceRates

Dla ExitRates i BounceRates dla Revenue = False widać duża liczbę obserwacji o okolicy 2 i zaóważaliny wzrost w okolicy 0.20

Month vs SpecialDay

VisitorType

New_Visitor dla ExitRates i BounceRates ma dużo obserwacji w okolicy 0. Dla Returning_Visitors instnieje wiele obcerwacji z wartościami pomiędzy 0 a 0.20.

Najwyższe PageValues jest dla New_Visitor. tym razem dużo obserwacji bliskich 0 przypada Returning_Visitors